Bối cảnh AlphaGo_đấu_với_Lee_Sedol

Thử thách khó khăn với trí tuệ nhân tạo

Bài chi tiết: Cờ vậy máy tính

Cờ vây là một trò chơi phức tạp, với việc đòi hỏi trực giác, sự sáng tạo và tư duy chiến lược.[7][8] Môn thể thao này từ lâu đã được coi là một thách thức khó khăn trong lĩnh vực trí tuệ nhân tạo (AI), và nó tỏ ra khó khăn[9] để giải quyết hơn một cách đáng kể so với cờ vua. Nhiều chuyên gia trong lĩnh vực trí tuệ nhân tạo cho rằng cờ vây đòi hỏi nhiều yếu tố bắt chước suy nghĩ của con người hơn cờ vua.[10] Nhà toán học I. J. Good viết trong năm 1965:[11]

Cờ vây trên một chiếc máy tính? – Để lập trình cho một chiếc máy tính chơi được một ván cờ vây hợp lý, chứ không phải chỉ đơn thuần là một ván cờ đúng luật – sẽ là cần thiết với việc chính thức hoá các nguyên tắc của chiến lược tốt, hoặc thiết kế một chương trình học tập. Các nguyên tắc này tỏ ra định tính và bí ẩn hơn cờ vua, và phụ thuộc nhiều hơn vào sự phán xét. Vì vậy, tôi nghĩ rằng sẽ còn khó khăn hơn cho một chương trình máy tính để chơi một ván cờ hợp lý của cờ vây hơn là của cờ vua.

Trước năm 2015,[12] các chương trình chơi cờ vây tốt nhất chỉ đạt đến mức độ dan nghiệp dư.[13] Trên cỡ bàn nhỏ 9×9, máy tính ở tình trạng tốt hơn, và một vài phần mềm đã giành chiến thắng một phần nhỏ của các ván đấu 9×9 trước các kì thủ chuyên nghiệp. Trước AlphaGo, một số nhà nghiên cứu đã khẳng định rằng máy tính sẽ không bao giờ đánh bại được những người hàng đầu trong cờ vây.[14] Elon Musk, một nhà đầu tư ngay từ ban đầu của Deepmind, đã phát biểu vào năm 2016 rằng những người giỏi nhất trong lĩnh vực này nghĩ rằng AI sẽ phải mất 10 năm nữa mới đạt được một chiến thắng với một kì thủ cờ vây chuyên nghiệp hàng đầu.[15]

Trận đấu giữa AlphaGo và Lee Sedol được so sánh với trận đấu cờ vua năm 1997 giữa Deep Blue đấu với Garry Kasparov. Chiến thắng của máy tính Deep Blue của IBM trước đương kim vô đich Kasparov được xem là điểm nhấn mang tính biểu tượng, nơi mà máy tính trở nên tốt hơn con người trong cờ vua.[16]

AlphaGo là chương trình có sự khác biệt đáng kể nhất so với những nỗ lực AI trước đó ở chỗ nó được áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết vấn đề bằng cách đánh giá, thử nghiệm và rút kinh nghiệm (evaluation heuristics) không bị mã hóa cứng bởi con người, mà thay vào đó là sự tự học ở mức độ lớn bởi bản thân chương trình, thông qua hàng chục triệu ván cờ vây cũng như những ván cờ tự chơi của chính nó. Thậm chí đội ngũ phát triển AlphaGo còn không thể chỉ ra được cách mà AlphaGo đánh giá các vị trí quân cờ và chọn bước đi tiếp theo. Phương pháp duyệt cây Monte Carlo cũng được dùng như phương pháp chính để nâng cao hiệu quả lý luận của chương trình.

Các kết quả nghiên cứu có liên quan đang được áp dụng cho các lĩnh vực như khoa học nhận thức, nhận dạng mẫuhọc máy.[17]

Trận đấu với Phiền Huy

Phiền Huy đấu với AlphaGo – Ván thứ 5

AlphaGo đánh bại nhà vô địch châu Âu Phiền Huy (Fan Hui), một kì thủ chuyên nghiệp 2 dan, với tỉ số 5–0 vào tháng 10 năm 2015, đây là lần đấu tiên một thực thể AI đánh thắng một kì thủ con người chuyên nghiệp trong một ván cờ với cỡ bàn lớn nhất và không sử dụng lợi thế.[18][19] Một số nhà bình luận nhấn mạnh khoảng cách lớn về thực lực giữa Phiền và Lee, người được xếp hạng 9 dan chuyên nghiệp.[20] Các chương trình máy tính Zen và Crazy Stone trước đó đã đánh bại những kì thủ là con người đạt 9 dan chuyên nghiệp với lợi thế chấp từ 4 đến 5 quân.[21][22] Chuyên gia về AI người Canada Jonathan Schaeffer, cho ý kiến ​​sau chiến thắng trước Phiền, so sánh AlphaGo với một "thần đồng" vẫn còn thiếu kinh nghiệm, và cho rằng, "thành tích thực sự sẽ là khi chương trình chơi với một kì thủ trong loạt những người cao cấp thực sự." Ông sau đó tin rằng Lee sẽ chiến thằng trận đấu vào tháng 3 năm 2016.[19] Hajin Lee, một kì thủ cờ vây chuyên nghiệp và là tổng thư ký của Liên đoàn cờ vây quốc tế, nhận xét rằng cô "rất vui mừng" trước viễn cảnh một thực thể AI thách thức Lee, và nghĩ rằng hai kì thủ có một cơ hội chiến thắng ngang nhau.[19]

Sau kết quả của trận đấu trước AlphaGo, Phiền Huy lưu ý rằng ván đấu đã dạy anh trở thành một kì thủ tốt hơn, và thấy được những thứ mà anh chưa từng thấy trước đó. Tới tháng 3 năm 2016, Wired báo cáo rằng thứ hạng của anh ta đã tăng từ 633 lên tới top 300.[23]

Sự chuẩn bị

Các chuyên gia cờ vây đã tìm ra những lỗi trong các nước đi của AlphaGo trước Phiền, đặc biệt chú ý đế sự thiếu nhận thức trên toàn bàn cờ, nhưng trước ván đấu mở màn trước Lee, người ta không biết chương trình đã cải thiện các ván đấu được bao nhiêu từ trận đấu vào tháng 10.[20][24] AlphaGo không được thiết kế để đấu với Lee Sedol, điều khó có thể thực hiện được trong bất kì trường hợp nào, bởi việc huấn luyện AlphaGo cần tới hàng chục triệu ván đấu, và một vài trăm hoặc vài nghìn ván đấu từ một kì thủ cụ thể sẽ không đủ để thay thế lối chơi của AlphaGo. Thay vào đó, việc huấn luyện của AlphaGo được bắt đầu với những ván đấu của những người chơi mạnh thuộc cấp độ nghiệp dư từ các máy chủ cờ vây trên internet, sau những ván mà AlphaGo luyện tập bằng cách tự đấu với chính mình; không có ván cờ nào của Lee Sedol có trong dữ liệu huấn luyện của AlphaGo.[25][26]

Tài liệu tham khảo

WikiPedia: AlphaGo_đấu_với_Lee_Sedol http://www.abc.net.au/news/2016-03-08/google-artif... http://www.cbc.ca/news/technology/alphago-ai-1.342... http://www.cbc.ca/news/technology/go-google-alphag... http://web.cs.ualberta.ca/~mmueller/ps/Go2000.pdf.... http://www.bbc.com/news/technology-35420579 http://www.bbc.com/news/technology-35785875 http://googleresearch.blogspot.com/2016/01/alphago... http://www.businessinsider.com/google-deepmind-to-... http://www.businessinsider.com/what-does-googles-d... http://money.cnn.com/2016/03/12/technology/google-...